#Artificial Analysis

1件の記事

最新動向

AIエージェント、IT運用の専門ベンチで50%未満

IBMとArtificial Analysisは、企業のIT運用タスクでAIエージェントを測る新指標ITBench-AAを公開した。59のシステム運用課題で、最上位のClaude Opus 4.7でも47%と、主要モデルはすべて50%に届かない。エージェントに任せきれる範囲を見極める材料になる。